Visualisation des données

Présences / Absences train

Jeu de données :

Ce jeu de données contient 85326 observations dont les principales variables sont :

  • “speciesId” Identification de l’espèce enregistré
  • “lat” lattitude de l’observation
  • “long” Longitude de l’observation
  • “date Date de l’observation
  • D’autres variables d’identification, de localisation ou de temporalité
#Appel du jeu de données et résumé
setwd("C:/Users/mbrei/Desktop/MIASHS/TER/R/data")
data <- read.csv2(file="Presences_Absences_train.csv")

datatable(data)
summary(data)
     glcID            gbifID            observer         datasetName       
 Min.   :4988269   Length:85325       Length:85325       Length:85325      
 1st Qu.:5095338   Class :character   Class :character   Class :character  
 Median :5201965   Mode  :character   Mode  :character   Mode  :character  
 Mean   :5239963                                                           
 3rd Qu.:5321044                                                           
 Max.   :5704919                                                           
     date             dayOfYear          year          lon           
 Length:85325       Min.   :  4.0   Min.   :2017   Length:85325      
 Class :character   1st Qu.:120.0   1st Qu.:2017   Class :character  
 Mode  :character   Median :170.0   Median :2018   Mode  :character  
                    Mean   :176.1   Mean   :2019                     
                    3rd Qu.:240.0   3rd Qu.:2019                     
                    Max.   :360.0   Max.   :2021                     
     lat             x_EPSG3035         y_EPSG3035        geoUncertaintyInM 
 Length:85325       Length:85325       Length:85325       Length:85325      
 Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character  
                                                                            
                                                                            
                                                                            
   speciesId        patchID         timeSerieID     
 Min.   :    1   Min.   :  55880   Min.   :3980325  
 1st Qu.: 2509   1st Qu.: 128751   1st Qu.:3984318  
 Median : 5263   Median :3009666   Median :3989603  
 Mean   : 5121   Mean   :2253840   Mean   :3990425  
 3rd Qu.: 7792   3rd Qu.:3015321   3rd Qu.:3995796  
 Max.   :10039   Max.   :3018859   Max.   :4008155  

Fréquence d’observations

#Tableau de contingence et histogramme
table <- data.frame(sort(table(data$speciesId),decreasing=T)[1:100])
colnames(table) <- c(var1="Id de l'espèce",Freq="Nombre d'observations") 

hist(data$speciesId,freq=T,breaks=500)
Nombre d'observations selon l'espèce

Nombre d’observations selon l’espèce

Visualisation de l’espèce la plus observée

#Nouveau df avec uniquement l'espèce 4284
species1 <- data[which(data$speciesId==4284),]

#Transformer la var date en type date
species1$date <- as.Date(data[which(data$speciesId==4284),]$date, format = "%d/%m/%Y")

#Nombre d'observations lors de l'étude
ggplot(species1, aes(x = date)) +
  geom_histogram(binwidth = 50, fill = "white", color = "black") +
  labs(title = "Evolution de nomvbre d'observations en fonction de l'année de l'espèce 4284",
       x = "Date",
       y = "Nombre d'observations")
Evolution de nombre d'observations en fonction des années de l'espèce 4284

Evolution de nombre d’observations en fonction des années de l’espèce 4284